3.6 序贯概率比检验

1 序贯检验

我们前面的假设检验都是基于样本数 n 固定的假设, 这就是固定样本检验. 但有些时候 n 由抽样的过程决定. 例如我们先抽样 n1 个, 得到样本 X1,,Xn1, 然后再去决定是否是否继续抽样. 这被称为序贯检验.

使用序贯检验的原因:

2 序贯概率比检验定义

设总体分布有概率函数 f(x,θ), θ{θ1,θ2}. 要检验 (2.1)H0:θ=θ1H1:θ=θ2.

若给定了样本大小 n, 抽样得到 iid 的 x1,,xn, 则根据 NP引理, UMP 检验有否定域 {i=1nf(xi,θ2)f(xi,θ1)>C}. 但是用 C 作为一个绝对的界限有些太绝对化, 因此 Wald 引入了一种序贯检验:

序贯概率比检验 (SPRT)

定义下面的检验程序:

  • 指定常数 A,B, (A<B).
  • 样本 x1,x2, 一个一个抽. 如果得到了 x1,,xn1 还不能停止, 则抽 xn, 然后计算 ln=i=1nf(xi,θ2)f(xi,θ1), 且当 lnA 时接受 H0, lnB 时拒绝 H0.
  • A<ln<B, 继续抽样 xn+1, 然后计算 ln+1 并进行判断.

把这种程序称为序贯概率比检验 (Sequential Probability Ratio Test, SPRT).

也就是说它提供了一种"容错机制", 只有在显著地偏向某一边时才做决定.
引进记号 Zi=lnf(xi,θ2)lnf(xi,θ1), Sn=i=1nZi, 则 SPRT 可以表示为: SnlnA 时接受 H0, SnlnB 时否定 H0; lnA<Sn<lnB 时继续观察 xn+1.

定理

φ(2.1) 的任意一个检验 (序贯或非序贯), 抽样次数记为 N, 犯 第一、第二类错误 的概率记为 α,β, 而 SPRT 对应的错误为 α,β.
如果 αα,ββ, 则 Eθ1(N)Eθ1(N), Eθ2(N)Eθ2(N).

也就是说, 在不超过某个错误概率的情况下, SPRT 的抽样次数最少.

3 边界值 A,B 的确定

现在给定了 α,β(0,1), 如何确定 A,B 的值, 使得对应的 SPRT 的两个错误概率恰好是 α,β?
这个问题的确切解答只对部分分布族适用, 且形式很复杂.

下面我们给一个近似结果: 可以用 SPRT(β1α,1βα) 近似 SPRT(A,B), 且犯错误的概率 α1,β1 满足 α1α1β,β1β1α,α1+β1α+β.

这说明单个错误可能会增大, 但不会变得太大, 而两个错误之和只会下降.

4 复合假设的情况

现在将假设检验推广为 H0:θθ0H1:θ>θ0.
我们可以指定 θ1,θ2 满足 θ1<θ0<θ2, 使得 θθ1 时, 拒绝 H0 是严重错误; θθ2 时接受 H0 是严重错误; θ1<θ<θ2 时接不接受都没有什么影响. 这样一来可以改写为 H0:θθ1H1:θθ2. 而在 θθ1 的范围里, 只有 θ1 这个点和 θθ2 最近, 因此它在某种程度上可以作为原假设的代表, θ2 类似. 所以我们有理由希望 SPRT 也可以用语复合假设检验.

此时, 我们希望维持关于犯错误概率的性质, 也即如果有 功效函数 β(θ)=n=1Tn(i=1nf(xi,θ))dx1dxn, 则是否有 {β(θ)α,θθ1,β(θ)1β,θθ2. (按照 A,B 的取法我们有 β(θ1)=α,β(θ2)=1β. ) 从而如果 β(θ) 关于 θ 单增, 则上面的不等式必然成立. 对于 指数分布族, 这是成立的.

Connected Pages
3.6 序贯概率比检验
  • 1 序贯检验
  • 2 序贯概率比检验定义 [!faq]- 两个 SPRT 的例子 总体分布为两点分布 Pp(X=1)=p, Pp(X=0)=1−p. 设 03 边界值 A,B 的确定
  • 4 复合假设的情况